协同过滤(collaboratice filtering)
- 基于物品的协同过滤(Itemcf)背景,例子,公式与工业界落地时的公式升级
- 基于用户的协同过滤(Usercf)背景,例子,公式与工业界落地时候的公式升级
- Itemcf与Usercf优缺点分析
背景
- 信息过载,用户实际需求不明确
- 强依赖于用户行为
Item cf
- 给用户推荐它之前喜欢的物品相似的物品
- 如何衡量相似物品(基于用户行为取衡量)
- 如何衡量喜欢(用户是否为真实点击,实际消费购买)
example
a d 物品是很相似的,因为用户A和D都喜欢它们,因此C卖了d之后,我们就可以推荐他买a,因为a和d是相似的。
公式
- 根据用户行为计算出物品相似度矩阵
和分别表示喜欢物品和喜欢物品的用户集合,分母用作归一化处理,惩罚了热门物品(与很多用户都喜欢的物品)对相似度计算的影响;表示的是用户对物品的得分,例如购买、收藏、加购物车等操作量化成为具体分值,而后归一化导0~1,就是物品相似度得分,根据物品完成推荐,是用户作用过的物品,是与i最为相似的前k个物品,一般k取前50个。
公式升级1
理论意义:活跃用户应该被降低在相似度公式中的贡献度
改进后的公式中,用户对物品的贡献都变得不一样了,表示的是用户作用过的所有物品,我们发现一个用户作用过的物品越多,他对相似度的贡献就越小,这是符合常理认知的。
公式升级2
理论意义:用户在不同时间对item的操作应给予时间衰减惩罚
分母相对一般的cf计算公式没变,变化的分子中,item 和行为的时间间隔越小,则其相似度越接近,行为差异越大,相似度也越小。